ИИ023
Введение в программирование на Triton
Настройка среды и выявление узких мест графического процессора
Цели обучения
- Настроить и проверить рабочую среду разработки для графических процессоров с использованием CUDA и ROCm.
- Выполнить системное профилирование для построения временных диаграмм выполнения ядер и анализа использования ресурсов.
- Различать вычислительно-ограниченные и ограниченно-памятью ядра с помощью метрик и моделей «roofline».
- Обнаруживать и уменьшать накладные расходы передачи данных по шине PCIe и задержки между хостом и устройством.